OpenAI/EvalsがGitHubで公開 以下のような評価を作成し実行できる データセットを使ってプロンプトを生成する、OpenAIモデルが提供する生成の品質を測定し、異なるデータセットやモデル間で性能を比較することができる。 できるだけ少ないコードで、できるだけ簡単にevalを構築できる。 https://t.co/hPRvhZYOXT

@o_ob